پیش بینی عملکرد پروتئین ها مبتنی بر روشهای یادگیری ماشین

پایان نامه
چکیده

با شناسایی کامل دنباله های پروتئینی در برخی از موجودات زنده همچون انسان، دوره جدیدی در علم زیست شناسی و علوم مرتبط آغاز گردید. هدف اصلی در این دوره، شناسایی عملکرد پروتئین های بی-شماری است که دنباله و ساختار آن ها به طور کامل شناسایی شده است، اما از عملکرد قطعی آن ها اطلاعات دقیقی در دسترس نیست. با توجه به نقش وکارکرد حیاتی پروتئین ها در بسیاری از فعالیت های حیاتی موجودات زنده، مطالعه و تعیین عملکرد آن ها در حوزه های گوناگونی حائز اهمیت می باشد. نخستین رویکرد جهت شناسایی عملکرد پروتئین ها، بهره گیری از روش های آزمایشگاهی است. از آن جایی-که این روش ها بسیار زمان بر و پرهزینه می باشند، می توان روش های محاسباتی را جایگزین مناسبی برای آن ها دانست. این روش ها دارای هزینه های به مراتب کمتر و در عین حال دقت عمل معقول و مناسبی هستند. از بین روش های محاسباتی موجود، تکنیک های یادگیری ماشین از جایگاه ویژه ای برای حل این مسأله برخوردارند. در واقع این تکنیک ها با استفاده از منابع داده ای موجود، مدلی را یادگیری می کنند که این مدل قادر به پیش بینی مجموعه عملکردهای یک پروتئین ناشناخته خواهد بود. علی رغم موفقیت های زیادی که در زمینه یادگیری مدل های دسته بندی حاصل شده است، هنوز تا رسیدن به مدل هایی با دقت و بهره وری قابل قبول، راه فراوانی در پیش است. در این پژوهش هدف، ارائه یک الگوریتم یادگیری ماشین، به منظور ارتقای بهره وری پیش بینی عملکرد پروتئین ها و در واقع، نزدیک شدن هر چه بیشتر تصمیم اتخاذ شده توسط ماشین، به تصمیم فرد خبره ی بیولوژیست می باشد. بدین منظور در این پژوهش دو روش ارائه شده است.، در روش اول یک الگوریتم درخت تصمیم فازی مبتنی بر کاهش واریانس پیشنهاد شده است که بدون نیاز به تبدیل ویژگی های عددی به مجموعه های فازی، درحین ساخت درخت و نه قبل از آن، مرزهای تصمیم را فازی می کند و قابلیت تخصیص چندین برچسب به هر نمونه را در کنار حفظ سازگاری رابطه ی سلسله مراتبی بین کلاس-ها، دارا می باشد. همچنین این الگوریتم می تواند بر روی هر دو ساختار درختی و گرافی بین کلاس ها اعمال شود. درحالی که روش دوم یک راه حل دو لایه ای ترکیبی را پیشنهاد می کند؛ که با فرض ناسازگار بودن کلاس های عملکردی نمونه های آموزشی، سعی در پیش بینی کلاس های عملکردی سازگار برای یک نمونه جدید دارد. نتایج ارزیابی الگوریتم بر روی چندین مجموعه داده، برتری روش های پیشنهادی را نسبت به دیگر کارهای ارائه شده در این زمینه، نشان می دهد.

منابع مشابه

پیش بینی تاخوردگی دامنه پروتئین ها مبتنی بر روش DBSCAN

در این مقاله یک روش طبقه بندی تغییر یافته بر مبنای روش های طبقه بندی بر اساس چگالی برای طبقه بندی تاخوردگی پروتئین ها ارائه شده است که این روش در برابر وجود نویز مقاوم بوده و از سرعت بالایی برخوردار خواهد بود. طبقه بندی پروتئین ها بمنظور پیش بینی عملکرد آنها و شناسایی خواص پروتئین ها یکی از مسائل بزرگ در حوزه طبقه بندی است. با توجه به پیشرفت علم و دستگاه های توالی یابی پروتئین های بسیاری کشف شد...

متن کامل

مقایسه ی شبیه ها و روشهای مختلف پیش بینی ماهانه ی جریان مبتنی بر هوش مصنوعی

پیش بینی دقیق جریان در رود ها از اهمیت بسزایی در مدیریت منابع آبهای سطحی برخوردار می باشد؛ به همین دلیل، همواره تلاشهای زیادی برای طراحی و معرفی شبیه های دقیق پیش بینی صورت گرفته است. در تحقیق حاضر با استفاده از شبیه های خود همبسته ی میانگین متحرک با ورودیهای غیر تصادفی (ARMAX)، ANN و GP برای پیش بینی ماهانه ی جریان به دو روش پیش بینی زنجیره ی زمانی و پیش بینی ماهانه ی مجزای جریان رود سعید آباد...

متن کامل

پیش بینی تاخوردگی دامنه پروتئین ها مبتنی بر روش dbscan

در این مقاله یک روش طبقه بندی تغییر یافته بر مبنای روش های طبقه بندی بر اساس چگالی برای طبقه بندی تاخوردگی پروتئین ها ارائه شده است که این روش در برابر وجود نویز مقاوم بوده و از سرعت بالایی برخوردار خواهد بود. طبقه بندی پروتئین ها بمنظور پیش بینی عملکرد آنها و شناسایی خواص پروتئین ها یکی از مسائل بزرگ در حوزه طبقه بندی است. با توجه به پیشرفت علم و دستگاه های توالی یابی پروتئین های بسیاری کشف شد...

متن کامل

پیش بینی برهم کنش های پروتئین-پروتئین مبتنی بر ساختار اول با کمک روش های یادگیری ماشین

مولکول پروتئین زنجیره خطی از اسید آمینه ها است. پیش بینی برهم کنش های پروتئین-پروتئین یک مسئله مهم در بیوانفورماتیک و سیستم های زیستی به حساب می آید. در حقیقت استخراج برهم کنش های میان پروتئین ها برای ساختن شبکه های برهم کنشی پروتئینی ضروری می باشد. این شبکه ها نقش مهمی در شناخت اکثر فرایندهای زیستی دارند. در سال های اخیر، از روش های آزمایشگاهی با توان عملیاتی بالا برای کشف برهم کنش های پروتئین...

15 صفحه اول

مروری بر روش‌های تخمین هزینه نرم‌افزار مبتنی بر یادگیری ماشین

Software project management software is the most important activity in software development, because it contains the whole software development process, from beginning to end. Software cost estimation is a challenge task in the software project management. It is an old activity in computer industry from 1940s and has been developed many times. Effort, only covers part of the cost of a software ...

متن کامل

پیش بینی تشخیص سندرم متابولیک مبتنی بر atpiii با رویکرد یادگیری ماشین

سندرم متابولیک مجموعه ای از اختلالات متابولیکی شامل چاقی، هیپرتری گلیسریدمی، عدم تحمل گلوگز، فشار خون بالا و اختلالات لیپیدها است که این مجموعه احتمال ابتلا به بیماری‏های قلبی و دیابت نوع 2 را چند برابر می‏کند. با توجه به افزایش شیوع این اختلال، انجام پژوهش هایی در جهت پیشگیری از ابتلا به این اختلال ضروری می باشد. اخیرا سیستم های مراقبت بهداشت مبتنی بر هوش‏مصنوعی به دلیل موفقیت‏هایی که در زمین...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023